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摘 要 : [目的 /意义 ] 科学 与 技术 之 间 的 密切 关系 ,使 得 结合 论文 与 专利 进行 技术 机 会 分 析 比 使 用 单一 数据 更 加 合理 与 
高 效 。 本 文 使 科学 技术 关系 的 生成 更 自动 化 ,减弱 对 主观 判断 的 依赖 ,使 技术 颗粒 更 加 精细 ,同时 为 技术 研发 人 
员 提 供 研 发 建议 ,将 科学 研究 中 汲取 的 理念 应 用 到 相应 的 技术 创新 中 去 。 [ 方法 “过程 ] 将 论文 .专利 的 摘要 文本 
进行 Doc2vec 向 量 表 示 ,通过 文本 相似 性 将 其 关联 成 网 络 ,再 基于 Louvain 算法 生成 科技 主题 聚 类 ,识别 科学 研究 


推动 的 技术 机 会 。 


最 后 以 3D 打印 技术 为 案例 进行 实证 研究 。[ 结果 /结论 ] 识别 出 若干 科学 研究 推动 的 技术 机 


会 ,并 验证 所 识别 的 机 会 具有 一 定 的 技术 潜力 ,证 明 方 法 的 可 行 性 和 有 效 性 。 
FE: 技术 机 会 分 析 科学 推动 力 ”专利 分 析 Doc2vec Louvain 算法 
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创新 是 技术 进步 与 经 济 发 展 最 重要 的 源泉 之 
志 F”。 为 合理 利用 有 限 的 资源 ,增强 创新 能 力 和 市 
争 力 ,科研 人 员 或 企业 研发 人 员 需 要 为 实现 创新 


而 疯 别 各 种 技术 机 会 。 技 术 机 会 分 析 (Technology Op- 
párlünity Analysis, TOA) 由 佐治 亚 理工 学 院 技 术 政 策 与 
Wen 心 的 Alan Porter 教授 于 20 世纪 90 年 代 提 出 


被 定义 为 通过 挖掘 某 领 域内 已 有 技术 的 发 展 趋势 及 相 
系 ,推断 该 领域 即将 可 能 出 现 的 技术 形态 或 技术 
发 展 热点 。A. L. Porter 教授 结合 技术 监测 与 文献 计 
量 分 析 , 进 行 了 技术 机 会 识别 研究 *“ 。 在 TOA 被 提 
出 局 的 20 多 年 中 ,全 球 学 者 对 技术 机 会 分 析 进 行 不 断 
的 研究 ,为 发 现 技术 机 会 分 析 提供 了 丰富 的 方法 。 

现 有 研究 大 多 基于 专利 数据 进行 技术 机 会 分 析 。 
专利 作为 测度 产业 技术 创新 的 指标 , 展现 了 技术 发 展 
的 成 果 喇 。 在 知识 密集 型 技术 中 ,科学 研究 是 技术 发 
展 的 基础 ,被 认为 是 技术 和 创新 的 种 子 '” 。 科 学 文献 
作为 科学 知识 记载 .传播 与 交流 的 主要 方式 ,反映 了 科 
学 发 展 过 程 和 取得 的 成 果 "” 。 因 此 ,许多 学 者 从 科学 
论文 中 寻找 技术 机 会 。 科 学 与 技术 的 关系 密 不 可 分 ， 
科学 研究 为 技术 创新 提供 种 子 , 也 为 技术 开发 输送 养 
料 。 从 科学 推动 的 视角 进行 技术 机 会 分 析 , 有 利于 将 
科学 研究 成 果 应 用 到 技术 开发 中 去 。 科 学 研究 与 技术 
开发 环节 相 结合 的 研究 通常 基于 论文 与 专利 两 种 数据 


源 展开 。 以 往 学 者 们 通过 混合 使 用 两 种 数据 或 分 别 使 
用 两 种 数据 进行 技术 机 会 分 析 , 但 都 不 能 较 好 地 利用 
科学 技术 之 间 的 关系 来 挖掘 技术 机 会 。 

部 分 学 者 将 论文 .专利 分 别 形成 科学 .技术 主题 两 
大 聚 类 并 进行 对 比分 析 , 克 服 了 前 两 类 研究 未 充分 利 
科学 与 技术 关系 的 缺陷 。 这 类 研究 将 论文 和 专利 形 
成 的 主题 关联 起 来 ,将 论文 中 存在 而 专利 中 不 存在 的 
主题 识别 为 技术 机 会 。 一 类 是 分 别 基于 论文 .专利 引 
证 网 络 形成 科学 与 技术 聚 类 ”“”。 由 于 发 展 不 成 熟 
的 技术 还 没有 形成 完善 的 引证 网 络 ,会 导致 网 络 稀 玻 。 
另 一 类 是 基于 文本 语义 分 别 构建 科学 聚 类 OR HOS, 
再 对 比 两 者 主题 差异 …“-” 。 由 于 两 种 数据 源 不 同 ,两 
种 聚 类 很 难 对 应 ,对 专家 的 依赖 程度 大 。 

为 了 克服 以 上 局 限 , 本 文 以 科学 与 技术 之 间 的 关 
系 为 理论 基础 , 先 通过 摘要 的 文本 相似 性 将 论文 .专利 
两 种 数据 关联 起 来 ,形成 关联 网 络 ,进而 生成 科技 主题 
聚 类 ,分析 每 个 聚 类 中 论文 和 专利 的 数量 及 驱动 关系 ， 
识别 科学 研究 推动 的 技术 机 会 ,从 而 增强 科学 .技术 主 
题 的 对 应 关系 ,并 减弱 了 对 专家 的 依赖 。 


1 相关 文献 综述 


1.1 科学 研究 与 技术 开发 的 交互 作用 
科学 研究 与 技术 开发 之 间 的 密切 关系 ,是 本 文 的 
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理论 基础 。 自 1965 年 M. Price 的 研究 ”以 来 ,研究 人 
员 发 现 , 随 着 创新 周期 的 缩短 ,技术 与 科学 研究 之 间 的 
联系 越 来 越 紧密 。S. Breschi 通过 科学 家 与 发 明 
家 的 紧密 联系 揭示 科学 与 技术 的 联系 ”。 丰 富 的 科 
学 研究 可 以 刺激 创新 和 技术 发 展 "” ,从 长 远 来 看 ,新 
技术 机 遇 最 重要 的 源泉 是 科学 知识 的 积累 。 科 学 可 以 
通过 两 种 方式 促进 工业 技术 :一 是 提供 理论 ,数据 和 解 
决 问题 的 能 力 ;二 是 直接 开发 新 的 技术 可 能 性 ,为 老 问 
题 提出 新 的 解决 方案 。 如 果 没 有 最 近 的 学 术 研究 ， 
就 会 少 10% 的 新 产品 和 新 工艺 5 。 相 反 ,科学 探索 较 
少 的 技术 也 可 能 激发 重要 的 科学 突破 ,大 多 数 应 用 研 
发 工作 都 是 从 需求 或 目标 开始 的 ,然后 再 回 到 科学 来 
实现 目标 ”。 因 此 ,科学 和 技术 是 相互 依存 的 。 
在 实证 研究 方面 , 赖 院 根基 于 主题 词 对 应 ,将 CLC 分 
KTH IPC 的 类 目 形成 映射 ,连接 论文 和 专利 以 探索 


^ 


科 淄 研究 与 技术 研发 的 关系 ” 。 许 多 实证 研究 表明 ， 
龙 量 的 科学 信息 在 专利 中 被 组 织 和 编纂 ,这 表明 越 来 
越 帮 的 技术 发 展 依赖 于 科学 “-”。 科 技 期 刊 论文 与 
芒 利 文献 之 间 的 相互 引证 现象 ,也 表明 科学 与 技术 之 
让- 基础 研究 与 技术 创新 之 间 相 互联 系 . 相 互 影响 与 相 
也 个 进 的 关系 "0 。L. Fleming 通过 基于 专利 数据 的 
实 焉 分 析 , 证 实 科 学 改变 了 发 明 家 的 寻找 过 程 ,使 他 们 
消 辽 无 效 研究 路 径 ,更 直接 地 找到 有 用 的 组 合 , 并 激励 
他 全 在 面 对 负 面 反馈 的 情况 下 继续 前 进 ?1 。 由 于 科 
学 尝 们 很 少 知道 他 们 的 科学 发 现 会 有 什么 样 的 工业 应 
用 5 市 公司 往往 不 知道 什么 科学 发 现 可 能 对 他 们 的 需 
RAH BI, T. Hellmann 构建 了 科学 家 和 企业 之 间 的 搜 
索 而 匹配 模型 ,弥合 了 科学 家 和 公司 进行 搜索 和 交流 
时 的 障碍 ,其 研究 发 现 ,为 科学 发 现 申请 专利 有 助 于 科 
学 界 将 他 们 的 发 现 推 向 工业 领域 5 。 
12 ”基于 科学 论文 与 专利 的 机 会 分 析 研究 

基于 论文 与 专利 的 技术 机 会 分 析 研 究 大 致 可 分 为 


3 类 : 
(1) 研究 不 区 分 论文 ,专利 的 数据 来 源 ,混合 使 
用 。 如 任 智 军 通过 挖掘 论文 和 专利 文本 ,实现 了 新 兴 
技术 发 现 方法 ,根据 特征 选择 结果 预测 技术 趋势 和 新 
XER, 

(2) 区 别 分 析 论 文 与 专利 ,分 别 识别 两 者 中 的 技 


前 沿 技术 预测 。 

(3) 将 论文 .专利 分 别 形成 科学 、 技 术 主 题 ,进行 
对 比分 析 , 克服 了 前 两 类 研究 未 充分 利用 科学 与 技术 
关系 的 缺陷 。 这 类 研究 将 论文 和 专利 形成 的 主题 关联 
起 来 ,将 论文 中 存在 而 专利 中 不 存在 的 主题 识别 为 技 
术 机 会 。 一 类 是 分 别 基于 论文 .专利 引证 网 络 形成 科 
学 与 技术 聚 类 ,如 N. Shibata 等 构建 论文 .专利 引证 网 
络 , 通 过 自然 语言 处 理 测 量 了 学 术 论 文集 和 专利 集 之 
间 的 语义 相似 性 ,挖掘 只 存在 于 学 术 研究 而 没有 专利 
的 前 沿 领域 ,以 支持 企业 与 政府 的 研发 投资 决策 。 
Y. Takano 和 Y. Kajikawa 分 别 构建 论文 .专利 引证 网 
络 ,计算 论 文 聚 类 、 专 利 聚 类 之 间 的 余弦 相似 性 , 选 出 
两 者 相似 度 低 、 论 文 多 而 无 专利 的 新 兴 聚 类 ,进行 技术 
机 会 分 析 ” 。 另 一 类 是 基于 文本 语义 分 别 构建 科学 聚 
类 技术 聚 类 ,再 对 比 两 者 主题 差异 。 如 M.Y. Wang 通 
过 挖掘 论文 和 专利 ,形成 科学 .技术 领域 聚 类 ,识别 出 
有 科学 活动 但 没有 技术 应 用 的 领域 ,提供 了 新 技术 机 
会 的 潜力 。 黄 鲁 成 . 王 静 静 抽取 论文 和 专利 文本 中 
的 SAO 结构 ,计算 论文 相似 度 和 专利 相似 度 ,通过 多 
维 尺度 分 析 总 结 聚 类 主题 ,识别 论文 中 存在 而 专利 中 
不 存在 的 主题 以 确定 技术 机 会 ”。 王 坤 等 提取 论文 、 
专利 文本 关键 词 并 构建 相 异 共 现 矩阵 ,采用 多 维 聚 类 
方法 识别 研究 热点 主题 ,将 论文 中 存在 而 专利 中 不 存 
在 的 主题 识别 为 技术 机 会 。 王 京 安 对 比分 析 科 技 
论文 和 专利 文献 中 关键 词 聚 类 .技术 研究 热点 ,发现 物 
联网 发 展 的 两 大 类 技术 机 会 分 别 是 在 物 联 网 应 用 层 上 
CIS 技术 和 平台 层 中 多 源 大 数据 下 融合 计算 技术 "1。 
韩 燕 运 用 连 边 关键 程度 中 心 度 指 标 、 知 识 单元 的 整合 
等 方法 提取 技术 主题 ,考虑 科学 研究 与 技术 成 果 这 两 
种 技术 形成 的 基础 对 技术 主题 进行 分 析 , 最 终 找 到 以 
“知识 关联 ”为 表现 形式 的 技术 机 会 ” V X. Li 通过 比 
较 技 术 主 题 首 次 出 现在 科学 论文 和 专利 中 的 时 间 差 
异 ,结合 文本 挖 气 和 专家 判断 ,预测 技术 短期 发 展 趋 
势 , 识 别 技术 机 会 ""。 整 理 归纳 第 三 类 研究 见 表 1。 
1.3 文献 评述 

技术 机 会 分 析 的 大 多 数 研究 都 使 用 单一 的 数据 
(科学 论文 或 专利 ) ,在 分 析 过 程 中 缺失 了 许多 有 用 的 
技术 信息 ,使 分 析 结 果 不 完 善 。 科 学 研究 与 技术 开发 


术 机 会 。 如 张 福 俊 基于 学 术 论 文 .专利 文献 ,采用 共 词 
分 析 法 和 谓词 树 分 析 法 在 论文 与 专利 之 间 以 及 专利 之 
间 进 行 对 比分 析 , 挖掘 出 海洋 科学 领域 的 技术 机 
会 。 王 兴旺 将 科技 论文 ,专利 和 科技 与 情 这 三 种 不 
同类 型 的 信息 结合 起 来 ,识别 高 暴发 强度 关键 词 用 于 


之 间 存 在 着 密切 的 关系 ,科学 研究 对 技术 研发 具有 推 
动力 。 若 将 科学 论文 与 技术 专利 结合 , 较 单 独 使 用 科 
学 论文 或 专利 ,有 利于 更 全 面 地 进行 技术 机 会 分 析 。 
然而 许多 研究 在 进行 论文 和 专利 的 联合 分 析 时 ,尽管 
同时 使 用 了 两 种 数据 ,涵盖 了 更 多 科技 信息 ,但 仍旧 是 
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HAW, RRE, EEE. 科学 推动 下 技术 机 会 发 现 方法 研究 [本 .图 书 情报 工作 ,2022,66(10) :19 - 32. 
表 1 基于 科学 论文 与 专利 关系 的 技术 机 会 分 析 研 究 
作者 主题 形成 方式 主题 关联 方式 研究 内 容 
N. Shibata, et al. (2010,2011 ) 引证 网 络 拓扑 聚 类 ATHIK 挖掘 只 存在 于 学 术 研究 而 没有 专利 的 前 沿 领域 
语义 相似 性 
Y. Kajikawa & Y. Kajikawa(2019) 。 专利 家 族 引 证 网 络 递归 聚 类 余弦 相似 性 选 出 相似 度 低 、 论 文 多 而 专利 少 的 新 兴 隧 类 
M. Y. Wang, et al. (2015) ORCLUS 聚 类 算法 ATHIK 识别 有 科学 活动 但 无 技术 应 用 的 领域 
黄 鲁 成 等 (2016) SAO 相似 度 聚 类 ATHIK 识别 论文 存在 而 专利 不 存在 的 主题 
王 京 安 等 (2018) Citespace 共 词 网 络 聚 类 ATHIK 识别 没有 科学 论文 的 技术 热点 ,没有 专利 的 科学 热点 
王 坤 等 (2018) 关键 词 多 维 聚 类 ATHIK 没有 科学 论文 的 技术 主题 没有 技术 专利 的 科学 主题 
韩 燕 和 彭 爱 东 (2020) 知识 单元 整合 ATH 找到 能 对 应 的 科学 主题 与 技术 主题 ， 
即 以 “知识 关联 "为 表现 形式 的 技术 机 会 
X. Li, et al. (2019) Lingo 聚 类 算法 时 间 差 异 人 工 判断 。 比较 技术 主题 首次 出 现在 科学 论文 和 专利 中 的 时 间 差异 ， 


分 别 对 两 种 数据 进行 分 析 ,将 其 割裂 开 来 ,缺少 两 者 之 
间 的 对 比 与 联系 ,也 并 未 将 两 者 的 关系 考虑 进去 。 
忆 近年 来 ,一 些 学 者 在 技术 机 会 分 析 的 研究 ( 见 表 
Li 四, 通过 分 别 聚 类 论文 和 专利 ,得 到 科学 主题 和 技术 
汐 晤 ,并 对 比分 析 , 克 服 了 以 往 研究 割裂 两 种 数据 的 缺 
随 呈 然而 ,上 述 研究 也 存在 局 限 性 :四 在 基于 引证 网 络 
KRR .技术 主题 的 研究 中 ,由 于 刚 兴起 的 技术 还 没 
有 形成 完善 的 引证 网 络 ,在 网 络 构建 时 会 被 排除 ,导致 
网 独 笑 琉 , 也 可 能 会 丢失 重要 信息 ;@ 论 文 与 其 参考 文 
朝 7N 一 定 讲述 同一 主题 。 在 基于 文本 形成 主题 聚 类 的 
而 关 中 ,由 于 两 种 数据 聚 类 所 使 用 的 文本 不 同 ,两 种 聚 
类 的 对 应 程度 比较 低 ,需要 靠 专家 进行 聚 类 的 对 应 识 
别 5 最 终 的 结果 技术 粒度 较 粗 , 且 通 过 这 种 方法 所 能 
Ee 的 科学 - 技术 主题 对 往往 只 有 寥寥 数 个 ,不 利于 
挖 饮 更 多 的 技术 机 会 。 
2-G 基 于 科学 推动 力 的 技术 机 会 分 析 方 法 
本 文 研究 框架 如 图 1 所 示 ,分 为 3 个 步骤 :数据 
收集 与 文档 向 量 表示 :选择 合适 技术 领域 ,收集 科学 论 
文 与 专利 数据 ,提取 摘要 文本 ,基于 Doc2vec 模型 将 论 
文 .专利 表示 成 “文档 - 特征 向 量 " 的 形式 ;@ 科 技 主 
题 网 络 的 构建 :基于 “文档 - 特征 向 量 " 计 算 各 文档 之 
间 的 余弦 相似 性 ,从 而 构建 科学 论文 与 专利 之 间 的 关 
系 网 络 ,通过 Louvain 社区 发 现 算法 形成 科技 主题 聚 
类 ,将 科学 论文 - 专利 网 络 分 割 成 若干 子 网 络 ;@@ 技 术 
机 会 发 现 :构建 <“ 相 对 科学 推动 力 "与 “相对 技术 成 果 
数量 "指标 ,建立 二 维 坐标 系 ,识别 潜在 的 技术 机 会 。 
科学 论文 数据 来 自 SCI( 科学 引文 ) 索 引 与 ELCT- 
程 ) 索 引 。SCI 是 国际 公认 的 进行 科学 统计 与 科学 评 
价 检索 工具 ,EI 则 是 著名 的 工程 技术 类 综合 性 检索 工 
具 , 两 者 收录 的 科学 论文 有 差异 也 有 交叉 ,但 都 是 本 文 
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预测 技术 短期 发 展 趋势 ,识别 技术 机 会 


研究 所 需 的 表征 科学 过 程 和 成 果 的 文档 。 本 文 以 科学 
论文 标题 为 匹配 依据 ,将 SCI 与 开 检 索 所 获取 的 文档 
去 除 重复 记录 , 即 取 两 者 的 并 集 作 为 研究 所 用 的 专利 
数据 集 。 技 术 专 利 数据 来 自 专利 数据 平台 德 温 特 创新 
索引 (Derwent Innovation Index, DIT)。 提 取 论 文 与 专 
利 数据 的 标题 摘要 文本 与 年 份 信息 ,作为 本 文 分 析 
之 用 。 

为 了 使 论文 与 专利 数据 关联 匹配 ,需要 用 文档 向 
量 表示 方法 将 两 者 摘要 文本 映射 到 同一 向 量 空间 。 过 
去 常用 的 文档 向 量 表 示 方 法 有 以 下 几 种 :四 Bag of 
Words , 即 词 袋 模型 ;@)Average Word Vectors ,对 句子 中 
的 所 有 词 向 量 简单 地 取 平 均 ;GOTF-IDF Weighted Word 
Vectors ,对 句子 中 的 所 有 词 向 量 根据 TF-IDF 权重 加 权 
求 和 。 这 3 种 方法 共同 的 缺点 是 都 不 考虑 单词 的 顺 
序 , 忽 略 了 语义 信息 。Doc2vec ”是 目前 较 有 效 的 文档 
向 量 表示 方法 , 它 是 一 种 无 监督 算法 ,基于 单词 的 上 下 
文 顺 序 从 文档 中 学 习 得 到 固定 长 度 的 特征 表示 ,用 于 
预测 一 个 向 量 来 表示 不 同 的 文档 ,克服 了 Bag of Words 
等 模型 忽略 单词 顺序 的 缺点 。Doc2vec 模型 是 受 
Word2Vec 词 向 量 模型 启发 而 来 ,与 Word2vec 相似 ， 
Doc2vec 也 有 两 种 训练 方式 一 一 PV-DM ( Distributed 
Memory Model of Paragraph Vectors) 和 PV-DBOW ( Dis- 


tributed Bag of Words version of Paragraph Vector) 。 
2.1 数据 收集 与 Doc2vec 文档 向 量 表 示 

本 文 使 用 python 的 gensim 库 进 行文 档 向 量 训 练 。 
根据 模型 作者 的 推荐 ” ,以 相同 的 参数 分 别 用 两 种 模 
型 训练 得 到 文档 向 量 , 再 将 两 组 向 量 组 合 使 用 。 为 了 
使 论文 向 量 与 专利 向 量 处 于 同一 空间 ,将 两 种 数据 源 
在 标记 后 放 在 一 起 训练 。 在 训练 之 前 ,为 了 得 到 更 好 
的 效果 ,将 摘要 文本 中 同时 出 现 频率 较 高 的 两 个 邻近 
词组 合 为 一 个 二 元 组 ,作为 一 个 单词 进行 模型 的 训练 。 
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相对 科学 推动 力 (R_SiPush) 


" 


相对 技术 成 果 数 量 (R_TeAmouni) 


ee 


Apa, 每 一 篇 论文 获得 文档 向 量 PA, ,每 一 条 专利 获得 
SGEE P7,, 所 有 向 量 的 长 度 是 相等 的 。 

2. À, 基于 Louvain 社区 发 现 算法 的 科技 主题 网 络 
HE 


(5 将 论文 与 专利 表达 为 文档 向 量 后 ,计算 每 一 条 论 
Xen | 文档 之 余弦 相似 度 : 
PA. - PT. 
[z cossim(1,j) TIPAMPTI 公式 (1) 


余弦 相似 度 的 值 分 布 在 0 -1 ZM], cossim (1,7) 的 
值 越 接 近 1, LB] Ye XC à 与 专利 j 在 内 容 上 越 相 似 , 越 
接近 0 ,说 明 两 者 越 无 关 。 为 了 提取 论文 与 专利 之 间 
的 关联 , 设 定 一 个 阔 值 ,排除 余弦 相似 度 小 于 冰 值 的 关 
系 对 ,而 将 余弦 相似 度 大 于 等 于 该 阔 值 的 论文 -专利 
对 作为 论文 - 专利 关联 网 络 中 的 边 ,重新 设 定 边 权重 
为 1, 从 而 构建 论文 - 专利 关联 网 络 。 

论文 -专利 关联 网 络 错 综 庞 杂 ,不 利于 解读 , 需 将 
其 聚 类 成 可 以 解读 的 主题 ,由 于 网 络 中 既 有 代表 科学 
的 论文 节点 ,又 有 代表 技术 的 专利 节点 ,本 文 将 其 聚 类 
后 的 主题 称 为 科技 主题 。 

Louvain 社区 发 现 算法 '” 是 社会 网 络 中 常用 的 聚 
类 方法 , 它 实际 上 是 基于 层次 聚 类 的 一 种 图 聚 类 方法 ， 
包括 交 蔡 和 欠 代 的 两 个 阶段 。 第 一 阶段 不 断 地 遍历 网 络 


1 科学 推动 下 技术 机 会 发 现 方法 研究 


中 的 节点 ,假设 每 个 节点 为 1 个 社区 ,N 个 节点 则 初始 
化 为 N 个 社区 ,尝试 将 单个 节点 加 入 能 够 使 模块 度 提 
升 最 大 的 社区 中 ,直到 所 有 节点 都 不 再 变化 。 模 块 度 
是 衡量 社区 分 区 质量 的 指标 , 值 越 高 , 则 社区 内 部 的 连 

边 多 、 社 区 外 部 的 连 边 少 , 即 更 聚集 。 在 加 权 网 络 的 情 
况 下 ,模块 度 的 计算 公式 如 下 : 


Q-u— Re 公式 (2) 


HP ARZ i 和 j 之 间 边 的 权重 ,h, = ,4; 是 连接 
节点 i 的 边 的 权重 之 和 ,ce; 是 顶点 i 被 分 配 到 的 社区 ,6 
(cc) 是 一 个 自 定义 函数 ,如 果 c =c, 则 56(cc) 取 值 


为 LEMNO, Hm= Èi; Ajo 


在 第 二 阶段 中 ,将 一 个 个 小 的 社区 归并 为 一 个 新 
的 节点 来 重新 构造 网 络 。 迭 代 这 两 个 步 又 直至 算法 稳 
定 , 即 所 有 子 社区 模块 度 总 和 不 变 。 

在 实际 研究 过 程 中 ,进行 一 次 Louvain 算法 后 , 存 
在 少数 几 个 规模 极 大 的 聚 类 , 旦 涵盖 了 网 络 中 绝 大 部 
分 的 节点 。 为 了 使 主题 粒度 更 小 更 精确 ,分 别 对 规模 
很 大 的 聚 类 进行 二 次 计算 ,同样 使 用 Louvain 算法 ,而 
其 他 小 类 仍 使 用 第 一 次 聚 类 的 结果 ,最 终 形成 数量 合 
适 的 科技 主题 聚 类 。 每 一 个 科技 主题 都 以 网 络 的 形式 
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存在 ,其 中 包含 论文 节点 与 专利 节点 ,是 论文 - 专利 关 
联网 络 的 子 网 络 。 
2.3 ”基于 科学 推动 力 的 技术 机 会 发 现 

在 本 文中 ,将 科学 推动 力 (SiPush) 定义 为 :在 某 个 
科技 主题 聚 类 网 络 中 ,存在 一 对 相连 的 论文 -专利 对 ， 
专利 的 发 表 年 份 晚 于 论文 至 少 n 年 ,这 对 关系 则 称 为 1 
个 科学 推动 力 ,推动 力 的 个 数 即 为 该 主题 中 SiPush 
的 值 。 

M. P. Carpenter 等 在 学 术 论文 和 专利 的 关联 研究 
中 ,分 析 了 专利 引用 学 术 论 文 的 时 灌 , 专 利 引用 论文 通 
常 在 论文 发 表 后 的 3 -5 4E CIEOCRIL OR UTI) ,与 
科学 论文 之 间 的 引用 相似 X. Li 从 专利 和 论文 中 
分 别提 取 技 术 主 题 和 科学 主题 ,研究 发 现 同一 主题 在 
专利 中 首次 出 现 比 在 论文 中 首次 出 现 晚 1 -2 年 (本 文 
稀 汉 为 主题 时 滞 ) 5 。 在 已 有 研究 中 , EANN SSI 
生 闻 滞 差 别 较 大 ,因为 主题 时 汪 基 于 内 容 的 相似 性 , 
用 本港 基 于 引用 关系 ,前 者 表示 科学 、 技 术 在 相对 独立 
发 展 的 情况 下 的 时 差 ,后 者 却 直接 体现 了 科学 对 技术 
推动 作用 的 时 洁 , 即 科学 研究 的 成 果 在 技术 研发 中 体 
JS E 3 年 时 间 。 因 此 在 论文 与 专利 关联 中 ,只 
dp en 1 请 年 份 晚 于 论文 发 表 时 间 3 年 及 以 上 , 才 
能 济 明 该 技术 发 明 的 推动 力 来 自 科 学 研究 ,而 不 是 相 
对 独立 的 发 展 。 本 文 研究 的 是 科学 推动 的 技术 机 会 ， 
丙 i 将 技术 机 会 的 科学 推动 力 来 源 限定 在 早 于 专利 申 
WE 3 年 及 以 上 ( 即 a=3) 的 科学 论文 中 。 
:三 假设 一 个 主题 中 的 论文 数量 为 SiNum, 构 建 以 下 
Vistos 

(1) 相 对 科学 推动 力 (R_SiPush) ,表示 一 个 科技 
主题 中 ,科学 推动 力 的 相对 大 小 ,计算 公式 为 : 
xt 公式 (3) 

其 中 ,SiPush 为 该 主题 中 科学 推动 力 的 数量 。 

(2) 相 对 技术 成 果 数 量 (R_TeNum) ,表示 科技 聚 
类 中 , 现 有 技术 成 果 的 相对 多 少 ,计算 公式 为 : 
TeNum 
SiNum 


其 中 ,7TeNum 为 该 主题 中 专利 的 数量 。 

如 图 2 所 示 ,图 中 网 络 代表 一 个 科技 主题 聚 类 , 空 
心 节 点 代表 论文 ,数量 为 7, 实 心 节点 代表 专利 ,数量 
为 6, 科 学 推动 力 ( 即 专利 发 表 年 份 晚 于 论文 3 年 及 以 
上 的 连 边 ) 个 数 为 12, 则 R SiPush 212/7 21.71,R Te- 
Num =6/7 20.86, 


R SiPush = 


R TeNum = 公式 (4) 


图 2 相对 科学 推动 力 、 相 对 技术 成 果 的 数量 计算 示例 


用 上 述 两 个 指标 建立 二 维 象限 ,如 图 3 所 示 。 横 
坐标 代表 相对 技术 成 果 数 量 , 科 技 主题 位 于 越 右 端 位 
置 , 表 示 在 科学 论文 数量 相同 的 情况 下 ,该 主题 的 专利 
数量 越 多 ,技术 实现 度 越 高 ; 纵 坐 标 代表 相对 科学 推动 
力 ,科技 主题 位 于 越 上 端的 位 置 ,表示 在 相同 科学 论文 
数量 下 ,该 主题 中 专利 与 论文 时 差 在 3 年 及 以 上 的 关 
联 数量 越 多 ,说 明科 学 论文 的 推动 力 相 对 较 大 。 

第 一 象限 (右上 角 区 域 ) ,科学 推动 力 与 现 有 技术 
成 果 都 相对 较 多 。 该 区 域 中 的 主题 ,技术 的 实现 对 科 
学 研究 依赖 程度 较 大 , 且 技 术 实现 程度 较 高 ,技术 发 展 
相对 趋 于 成 熟 , 未 来 可 开发 的 技术 机 会 可 能 相对 较 少 ， 
不 适合 作为 技术 机 会 挖掘 的 区 域 。 

第 二 象限 (左上 角 区 域 ) ,科学 推动 力 大 ,但 现 有 
技术 成 果 少 。 该 区 域 中 的 主题 ,技术 实现 对 科学 研究 
的 依赖 程度 大 ,但 已 实现 的 技术 成 果 并 不 多 ,未 来 技术 
被 开发 的 可 能 性 较 大 , 且 易 于 从 科学 研究 中 汲取 技术 
开发 需要 的 理论 基础 。 该 区 域 可 用 于 挖掘 基于 科学 推 
动力 的 技术 机 会 。 


相对 科学 推动 力 (R_SiPush) 


相对 技术 成 果 数 量 (R_TeNum) 


图 3 技术 机 会 二 维 象 限 图 
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第 三 象限 (左下 角 区 域 ) ,科学 推动 力 与 现 有 技术 
成 果 都 相对 较 少 , 技 术 实 现 对 科学 研究 的 依赖 程度 、 技 
术 本 身 的 实现 度 都 较 低 ， 可 能 是 科技 主题 处 于 起 步 阶 


3.2 ”科技 主题 网 络 构建 
将 论文 .专利 表示 成 文档 向 量 之 后 ,计算 论文 、 专 
利 两 两 之 间 的 余弦 相似 度 , 取 阔 值 为 0.5 ,相似 度 大 于 


段 或 衰落 阶段 ,可 从 科学 研究 中 汲取 的 理论 与 理念 也 
相对 较 少 。 该 区 域 的 主题 不 在 本 文 讨论 范围 内 。 
第 四 象限 ( 右 下 角 区 域 ) ,科学 推动 力 较 少 , 现 有 
技术 成 果 较 多 。 表 明 技术 已 趋 于 成 熟 ,未 来 可 发 展 的 
技术 机 会 相对 较 少 。 较 少 的 科学 推动 力 表明 该 主题 中 
技术 实现 对 科学 研究 的 依赖 程度 较 低 ,或 技术 已 发 展 
成 熟 . 无 需 大 量 的 科学 研究 支持 。 该 区 域 也 不 在 本 文 
讨论 范围 之 内 。 

基于 本 文 的 研究 目标 ,选取 第 二 象限 作为 发 现 技 
术 机 会 的 区 域 。 


3 多 实证 研究 
xd) 

CD 打印 (three-dimensional printing) ,又 称 增 材 制 
sidditive manufacturing) ,是 一 种 快速 成 型 技术 ,是 当 
3 展 迅速 的 热门 技术 领域 之 一 。3D 打印 技术 经 过 
年 的 发 展 ,已 有 一 定 基 础 , 且 当 前 还 处 于 快速 发 展 
的 萎 段 ,科学 论文 与 技术 专利 都 有 可 观 的 数量 并 持续 
上 漳 。 在 商业 领域 ,应 用 广泛 ,是 本 研究 较为 合适 的 
zø 


3D 打印 领域 技术 机 会 


数据 检索 及 文档 向 量 模型 

ELA 2010 -2019 年 为 检索 区 间 ,参考 以 往 学 者 的 相 
KWER O ,拟定 检索 式 "TI= (((3D OR 3 -D OR (3 
ADJ2 dimension" ) OR (three ADJ2 dimension * ) OR 
additive) ADJ ( print OR fabricat” OR manufac- 
tur” ) ) )" ,分 别 使 用 SCIEI Derwent 索引 进行 论文 E 
利 数据 的 检索 ,检索 时 间 为 2021 年 2 月 9 Ho SCIL EI 
论文 合并 、 去 重 、 删 去 无 效 数据 后 共 23 018 篇 , 德 温 特 
专利 删 去 无 效 数据 后 共 22 250 条 。 根 据 本 文 研究 设 
计 , 专 利 申请 年 份 晚 于 论文 3 年 及 以 上 才 视 为 科学 对 
技术 具有 推动 力 , 另 预 留 2018 -2019 年 数据 作为 结果 
验证 ,所 以 本 文中 论文 数据 涉及 年 份 范围 为 2010 - 
2014 年 ,专利 为 2013 -2017 年 。 

经 过 反复 尝试 ,并 结合 模型 作者 设 定 的 默认 参 
JU , 设 定 Doc2 vec 模型 文档 向 量 维 数 为 100 ,滑动 
窗口 长 度 为 10 .单词 最 小 频率 为 4, 并 将 文本 中 相 邻 
出 现 频率 大 于 或 等 于 20 次 的 两 个 单词 组 合成 二 
元 组 。 


A&-F pi (E f) 36 c - 专利 对 视 为 有 内 容 关 联 , 记 为 一 条 
连 边 , 由 此 构建 论文 - 专利 关联 网 络 。 
基于 论文 - 专利 关联 网 络 , 用 Louvain 社区 发 现 算 
法 进行 聚 类 。 第 一 次 聚 类 后 , 共 发 现 5 个 较 大 的 社区 ， 
分 别 包 含 11 395 ,4 635 .7 634 .10 689 .5 769 个 节点 ,其 
余 社 区 节点 数 均 不 足 60 个 。 将 上 述 5 个 类 团 进行 二 
次 聚 类 ,排除 不 具有 科学 推动 力 的 社区 , 共 得 到 有 效 科 
技 主 题 107 个 。 
3.3 技术 机 会 发 现 

计算 107 个 科技 主题 聚 类 的 相对 科学 推动 力 与 相 
对 技术 成 果 数 量 , 取 两 者 的 中 位 数 mediang sipan = 
0. 410 , median, resum = 0. 960 作为 划分 象限 的 闽 值 ,由 
于 存在 极 值 点 "1_14”, 对 其 他 点 的 可 视 化 展示 造成 影 
响 ,所 以 将 该 点 排除 ,绘制 如 图 4 所 示 的 二 维 散 点 图 ， 
图 中 一 个 点 代表 一 个 科技 主题 ,标签 为 其 聚 类 编号 ， 
“- ”前 的 数值 代表 第 一 次 聚 类 的 结果 ,“- ”后 的 数值 
代表 第 二 次 聚 类 的 结 

处 于 第 二 象限 的 科技 主题 共 23 个 ,科学 推动 力 相 
对 较 大 , 现 有 的 技术 成 果 相 对 较 小 ,是 本 文 识 别 技术 机 
会 的 目标 区 域 。 这 23 个 科技 主题 中 科学 推动 力 (Si- 
Push) ,论文 数量 (SiNum) 、 专 利 数量 (TeNum) 、 相 对 科 
学 推动 力 (R_SiPush) .相对 技术 成 果 数 量 (R_TeNum) 
的 统计 结果 见 表 2。 

选取 规模 较 大 的 10 个 科技 主题 为 示例 进行 结果 
解读 与 验证 ,由 于 主题 “5_9”“3_9”“5_10” 意 义 较为 
模糊 , 故 没有 选取 。 根 据 论文 .专利 标题 中 的 关键 词 来 
推断 主题 内 容 , 各 主题 的 高 频 词 ( 含 科学 词 .技术 词 两 
类 ,分 别 来 自 论文 ,专利 的 标题 ) 如 表 3 所 示 , 限 于 篇 
幅 , 仅 展示 频率 最 高 的 5 个 词 。 排 序 方 式 采用 加 权 频 
率 的 方法 , 即 标题 词 的 频率 以 某 个 词 在 论文 -专利 关 
联 对 中 出 现 的 次 数 计算 ,如 文档 重复 出 现 ,标题 词 也 会 
重复 计算 频率 ,因为 存在 关联 较 多 的 文档 ,理论 上 在 聚 
类 中 扮演 更 重要 的 角色 ,因此 其 标题 词 的 权重 也 重复 
计算 。 科 技 主题 内 容 推 断 结果 见 表 3, 即 为 本 文 所 识 
别 的 技术 机 会 。 各 主题 的 高 频 科 学 词 技术 词 可 视 化 
见 图 5, 科 学 词 以 浅 灰 色 的 节点 表示 、 节 点 标签 以 
“[si] "开头 ,技术 词 以 深 灰 色 节 点 表示 、` 节 点 标签 以 
* Lie] "开头 。 
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m 
er 表 2 第 二 象限 聚 类 相关 数据 统计 
F 主题 SiPush SiNum TeNum R_SiPush R_TeNum 
N 11 1 024 544 496 1.88 0.91 
Q ss 320 197 159 1.62 0.81 
CN 31 313 255 175 1.23 0.69 
"m 
> 41 308 293 268 1.05 0.91 
Emm 
39 302 168 143 1.8 0.85 
a 34 284 244 184 1.16 0.75 
21 210 302 153 0.7 0.51 
Bum 
E 47 201 368 309 0.55 0.84 
5 10 148 229 153 0.65 0.67 
5-9 131 201 152 0.65 0.76 
46 125 238 145 0.53 0.61 
5 13 124 241 172 0.51 0.71 
3:5 113 103 56 1.1 0.54 
5 11 100 130 111 0.77 0.85 
51 96 113 71 0.85 0.63 
2-2. 96 130 95 0.74 0.73 
4_11 93 176 141 0.53 0.8 
311 33 66 48 0.5 0.73 
1 13 15 32 29 0.47 0.91 
43 9 12 11 0.75 0.92 
38 4 9 8 0.44 0.89 
187 2 3 2 0.67 0.67 
121 2 2 1 1 0.5 
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表 3 


科技 主题 聚 类 高 频 词 表 与 主题 内 容 推断 


RK 论文 高 频 标 题词 加 权 频 率 专利 高 频 标题 词 加 权 频 率 
11 3D 打印 显示 设备 photonic crystal 光子 晶体 609 memory device 存储 设备 628 
holographic fabrication 全 息 制 作 378 circuit board 电路 板 392 
3d photonic crystal 三 维 光 子 晶体 361 liquid crystal 液晶 357 
lens antenna 透镜 天 线 326 display device 显示 设备 321 
millimeter wave 毫米 波 311 semiconductor device 半导体 器 件 308 
31 3D 打印 电极 3d graphene 三 维 石墨 烯 448 active material 活性 物质 754 
graphene oxide 石墨 烯 氧化 物 404 organic solvent 有 机 溶剂 531 
performance supercapacitor 超级 电容 器 性 能 403 lithium salt 锂 盐 455 
carbon nanotube RAKE 371 lithium ion battery 锂 离子 电池 453 
reduced graphene oxide 降低 石墨 烯 氧 化 物 “365 functional additive 功能 性 添加 剂 388 
41 陶瓷 3D 打印 binder jet 粘 结 剂 喷射 449 sintering additive 烧结 添加 剂 903 
binder jetting 粘 结 剂 喷射 396 silicon nitride 氮 化 硅 711 
laser additive manufacturing 激光 增 材 制造 271 pressureless sintering 无 压 烧 结 386 
alumina ceramic AE B i] s 210 ceramic material 陶瓷 材料 370 
q— particle size distribution 粒度 分 布 195 lanthanum oxide 氧化 铀 303 
> powder packing 粉末 包装 195 silicon carbide 碳化 硅 284 
[ox | 3D 喷 墨 打印 inkjet printing 喷 墨 打印 163 epoxy resin 环 氧 树脂 433 
CO current collector 集 电 器 130 printing ink 印刷 油墨 433 
N patterned 3d silicon 有 图 案 的 三 维 硅 129 circuit board 电路 板 388 
= patch antenna 贴 片 天 线 120 conductive ink 导电 油墨 347 
" aerosol jet 气 溶胶 喷射 115 printed circuit 印刷 电路 346 
b i 骨 组 织 3D 打印 calcium phosphate HRAT 541 bone tissue 骨 组 织 383 
e bone tissue 骨 组织 474 3d printing base 3d 打印 技术 基础 225 
tricalcium phosphate 磷酸 三 钙 422 bone defect Erikin 225 
e bone regeneration 骨 再 生 420 calcium phosphate HRA 224 
N bone tissue engineering 骨 组 织 工程 364 bone repair THER 220 
JW 3D 打印 powder bed 粉 床 519 powder bed 粉 床 203 
nm powder bed fusion 粉 床 融 合 417 operational flaw 操作 缺陷 141 
x< powder bed fusion additive ARIEI 372 coordinate position 坐标 位 置 132 
© laser powder 激光 粉末 323 laser additive 激光 增 材 125 
CS metal additive 金属 增 材 256 laser additive manufacturing 激光 增 材 制造 124 
E 食物 3D 打印 food additive 食品 添加 剂 97 feed additive 饲料 添加 剂 297 
© extrusion 3d printing 挤 压 3d 打印 71 food additive 食品 添加 剂 279 
3d food 3d 食物 64 fresh lemon juice 新 鲜 的 柠檬 汗 191 
3d food printer 3d 食物 打印 机 49 momordica grosvenori extract 罗汉 果 提 取 物 191 
food printer 食物 打印 机 49 rich nutrition 营养 丰富 191 
46 激光 金属 3D 打印 laser additive manufacturing 激光 增 材 制 造 478 alloy powder 合金 粉末 882 
powder bed 粉 床 259 aluminum alloy 铝 合金 424 
powder bed fusion 粉 床 融 合 254 titanium alloy KEE 242 
selective laser 选择 性 激光 215 high temperature 高 温 206 
laser melting 激光 熔化 191 powder composition 粉 成 分 180 
5_13 3D 打印 设备 质量 fault diagnosis 故障 诊断 75 3d model 三 维 模型 184 
控制 3D 打印 delta 3d printer 83 d 打印 机 64 control module 控制 模块 
云 服 务 系统 additive manufacturing security 增 材 制造 安全 58 cloud server 云 服务 器 101 
nanocellulose ink 纳米 纤维 素 墨水 58 control system 控制 系统 94 
security awareness perspective 安全 意识 的 角度 58 inventory spare part 库存 备件 92 
35 3D 打印 复合 材料 polymer composite 聚合 物 复合 材料 72 composite material 复合 材料 361 
carbon fiber 碳纤维 59 lactic acid 乳酸 279 
lactic acid 乳酸 54 polylactic acid RIL 279 
surface layer 表层 51 toughening agent 36558] 235 
bone regeneration 骨 再 生 47 inorganic filler 无 机 填料 218 
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[5.13] 3D 打印 设备 质量 控制 、3D 打 印 云 服务 系统 


图 5(B) 
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主题 "1_1 "为 3D 打印 显示 设备 ,根据 “全 息 制 
作 ”“ 三 维 光子 晶体 ”等 高 频 论文 标题 词 与 “液晶 ”“ 显 
示 设 备 " 等 高 频 专 利 词 ,技术 开发 人 员 可 从 科学 研究 中 
挖掘 全 上 县 技术 的 理论 基础 ,开发 3D 打印 全 息 显 示 屏 。 
主题 3_1 为 3D 打印 电极 ,根据 “超级 电容 器 性 能 ” 
“高 性 能 “电化 学 性 能 ” 等 论文 标题 词语 与 “有 机 溶 
剂 “ 电 极 材料 "等 专利 标题 词 ， DAR nU 
有 机 溶剂 .电极 材料 ,科学 研究 的 推动 ,有 望 使 其 
性 能 方向 发 展 。 主 题 “4_1 ”为 陶瓷 3D 0 
可 借鉴 科学 研究 ,从 陶瓷 材料 烧结 工艺 等 方面 对 技术 
进行 创新 或 提高 。 主 题 “3_4” 是 3D 喷 墨 打印 ,技术 人 
员 可 在 印刷 油墨 等 方向 进行 技术 开发 ,并 从 科学 研究 
中 获取 相关 知识 。 主 题 “2_1 "是 骨 组 织 3D 打印 ,技术 
人 员 可 从 科学 研究 追踪 汲取 知识 与 理念 ,开发 或 改进 
骨 组 织 3D 打印 技术 ,从 骨 再 生 、 骨 组 织 修 复 等 技术 中 
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[35] 3D 打印 复合 材料 


技术 机 会 主题 词 网 络 ( 续 ) 


找到 技术 机 会 。 主 题 “4_7 "是 粉 床 3D 打印 ,技术 人 员 
可 从 粉 床 .激光 3D 打印 技术 等 方面 的 技术 机 会 中 进行 
技术 创新 。 主 题 “5_9 "是 食物 3D 打印 ,科学 研究 的 发 
展 推动 技术 的 进步 ,从 食品 打印 原材料 提取 、 食 品 与 饲 
料 3D 打印 技术 等 方面 带 来 技术 机 会 。 主 题 “4_6” 是 
激光 金属 3D 打印 ,金属 粉末 材料 .激光 3D 打印 技术 、 
记忆 材料 等 方面 存在 技术 机 会 ,同时 可 能 科学 研究 成 
果 中 借鉴 相关 理念 。 主 题 “5_13” 是 3D 打印 设备 质量 
控制 .3D 打印 云 服务 系统 ,从 科学 研究 中 据 取 故障 诊 
| 3D 打印 设备 的 质量 与 
善 3D 打印 云 服务 系统 中 去 。 主 题 *3_5” 是 3D 打印 
复合 材料 ,可 借鉴 科学 研究 中 的 各 种 化 学 实验 ,材料 研 
ÍT 3D 打印 复合 材料 的 创新 与 改进 。 

3.4 结果 验证 

为 验证 本 方法 所 识别 的 机 会 


是 否 具有 较 大 的 技术 
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潜力 ,以 及 技术 潜力 是 否 在 较 大 程度 上 由 科学 研究 推 
动 ,将 各 技术 主题 2013 - 2019 年 的 专利 数量 .以 及 具 
有 科学 推动 力 的 专利 数量 进行 统计 展示 ,如 图 6 Bros, 
其 中 直方 图 代表 该 科技 主题 中 的 专利 数量 ,折线 图 代 
表 该 主题 中 具有 科学 推动 力 的 专利 数量 。 图 6 中 所 有 
主题 的 专利 趋势 呈 快 速 上 升 趋势 (直方 图 ) ,科学 推动 
的 趋势 也 快速 增长 (折线 图 ) ,个 别 主题 的 专利 数量 在 


iS zu 


2014 2016 2018 2014 2016 2018 


sp E: Ss 41 
> E: 20- 
a. 
up e 
oR 
© š 5 
E $ 2014 2016 2018 2014 2016 2018 
z 513 59 
et 
D 5 
CN 
50- 
e 
CN 25- 
" m 
> " 1 
x 2014 2016 2018 2014 2016 2018 
© 
c 
HEHER 
C 
Q 


各 技术 机 会 在 科技 主题 散 点 图 中 处 于 第 二 象限 。 
为 了 对 比 该 象限 与 其 他 象限 的 专利 增长 趋势 ,绘制 了 
第 一 .三 .四 象限 的 专利 数 与 具有 科学 推动 力 的 专利 数 
趋势 图 ( 见 图 8) 。 在 第 一 象限 中 ,尽管 科学 推动 力 ( 折 
线 图 ) 的 占 比 较 高 ,但 专利 总 数 ( 直方 图 ) 不 具有 明显 
的 上 升 趋势 ,该 区 域 的 科技 主题 可 能 处 于 较 成 熟 的 发 
展 阶 段 ,产生 技术 机 会 的 可 能 性 不 大 ;第 三 、 四 象限 中 ， 
具有 科学 推动 力 的 专利 数 (折线 图 ) 占 专利 总 数 (直方 
图 ) 的 比重 始终 较 低 ,说 明 这 两 个 象限 中 的 技术 发 展 受 
科学 研究 的 影响 相对 较 小 , 且 第 四 象限 的 专利 总 数 不 
具有 明显 上 升 趋势 ,表明 这 两 个 象限 中 的 技术 在 科学 
推动 下 的 发 展 潜力 不 大 。 

在 其 他 学 者 的 3D 打印 领域 技术 机 会 分 析 研 究 中 ， 
王 金 凤 ”通过 专利 文本 挖掘 和 形态 分 析 , 识 别 出 切 换 
式 多 色 打 印 机 头 ,激光 烧结 复合 材料 的 组 合 为 最 佳 技 


2019 年 看 似 有 所 回落 ,可 能 是 因为 专利 申请 到 公开 具 
有 一 定 的 时 间 延 迟 ,导致 德 温 特 数据 库 收 录 的 2019 年 
专利 数据 不 完整 。 此 外 ,具有 科学 推动 力 的 专利 数 ( 折 
RE) 占 专 利 总 数 (直方 图 ) 的 比重 超过 大 半 , 且 该 比 
例 有 上 开 趋 势 。 总 体 来 说 ,该 统计 结果 可 以 说 明 本 文 
方法 所 识别 的 技术 机 会 确实 具有 技术 洪 力 , 且 在 较 大 
程度 上 由 科学 研究 推动 ,验证 了 方法 的 有 效 性 。 
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6 各 技术 机 会 2013 -2019 年 专利 数量 走势 


术 机 会 。 王 京 安 “从 科学 论文 与 专利 相 结 合 的 角度 ， 
识别 出 科学 理论 专利 化 .产业 化 的 机 会 :用 直接 激光 金 
属 烧结 和 沉积 技术 改变 材料 特性 .通过 非 线性 建 模仿 
真 测试 金属 材料 特性 。 以 上 结果 与 本 文 识别 的 激光 金 
属 3D 打印 3D 打印 复合 材料 陶瓷 3D 打印 等 主题 或 
主题 中 包含 的 技术 元 素 部 分 吻合 , 且 本 文 识别 的 技术 
机 会 范围 更 广 数量 更 多 ,从 男 一 个 角度 验证 了 本 文 方 
法 的 效果 和 优势 。 


4 总 结 与 讨论 


本 文 从 科学 研究 与 技术 开发 环节 结合 的 角度 ,介绍 
了 科学 推动 下 的 技术 机 会 发 现 方法 。 该 方法 以 科学 论 
X .技术 专利 为 数据 源 ,用 Doc2vec 模型 将 两 者 摘要 文 
本 表示 成 同一 空间 中 的 向 量 ,通过 计算 余弦 相似 度 将 
两 者 关联 ,形成 论文 - 专利 关联 网 络 ， 进 而 用 Louvain 
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第 一 象限 主题 
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专利 总 个 数 ( 直方 图 ) 
具有 科学 推动 力 的 专利 个 数 ( 折线 图 ) 
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siste 3c - 专利 关联 网 络 形成 科技 主题 聚 类 ,构建 
彬 对 科学 推动 力 . 相 对 技术 成 果 数 量 指标 ,识别 出 科学 
推 熏 力 相对 较 大 .而 当前 技术 成 果 相 对 较 少 的 科技 主 
是 从 为 技术 机 会 。 技 术 开发 人 员 可 关注 这 些 技术 机 
会 品 重 从 科学 研究 中 汲取 理 ? 他 知识 与 相关 理念 ,应 用 
到 相应 的 技术 创新 中 去 。 

OHE 3D 打印 的 案例 研究 中 ,该 方法 有 效 地 形成 了 论 
文 专利 的 文档 向 量 表示 ,构建 了 论文 - 专利 关联 网 络 
与 科技 主题 网 络 , 最 终 识别 了 科学 推动 下 的 技术 机 会 ， 
并 验证 了 所 识别 的 机 会 具有 一 定 的 技术 潜力 ,证 明了 
方法 的 有 效 性 。 不 同 于 以 往 基于 论文 与 专利 关系 识别 
技术 机 会 的 研究 ,该 方法 无 需 将 科学 主题 与 技术 主题 
人 工 配 对 ,在 科技 主题 形成 之 前 就 将 论文 与 专利 联系 
起 来 ,减少 了 对 主观 判断 的 部 分 依赖 ,使 过 程 更 加 自动 
化 ,也 使 技术 颗粒 更 加 精细 化 。 

本 研究 也 存在 一 些 不 足 之 处 :中 人 为 设 定 余弦 相 
似 度 阔 值 是 来 筛选 论文 - 专利 关联 网 络 , 可 能 会 把 一 
些 接近 阔 值 但 确 有 关联 的 关系 排除 ,造成 网 络 中 连 边 
的 损失 。 在 未 来 的 研究 中 ,会 设计 更 完善 的 方法 来 构 
建 关 联网 络 。@ 科 学 与 技术 的 关系 是 相互 的 ,科学 对 
技术 具有 推动 力 ,技术 对 科学 也 具有 拉动 作用 ,本 文 只 
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图 7 第 一 、 三 、 四 象限 主题 2013 - 2019 年 专利 数量 走势 


考虑 了 前 者 ,在 未 来 的 研究 中 ,可 以 考虑 技术 对 科学 的 
拉动 作用 ,挖掘 科研 机 会 。@) 若 在 基于 本 文 的 网 络 构 
oe 加 入 引证 关系 ,会 使 网 络 更 加 精确 。 但 在 实 
尝试 中 ,由 于 专利 对 论文 的 引用 较 少 ,导致 网 络 十 分 
m 对 文本 网 络 的 影响 微乎其微 ,因此 目前 只 使 用 文 
本 的 方法 构建 网 络 。 未 来 会 在 研究 中 尝试 解决 这 个 问 
题 ,采用 合适 的 方法 将 引证 关系 引入 基于 文本 的 网 络 
中 ,使 网 络 更 加 优化 。 由 在 创新 链条 中 ,除了 科学 研究 
与 技术 开发 两 个 环节 ,还 有 商业 应 用 环节 ,三 者 之 间 交 
互 影 响 ,未 来 可 把 技术 机 会 分 析 扩 展 到 创新 全 链条 , 结 
合 多 个 环节 更 全 面 地 识别 技术 机 会 
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